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摘要 : [目的 /意义 ] 识别 新 颖 专利 代替 由 一 组 关键 词 代表 的 专利 空白 ， 


改善 技术 机 会 识别 过 于 主观 


的 缺陷 。[ 方法 /过 程 ] 利用 一 种 基于 系统 流程 的 定量 方法 识别 专利 的 新 颖 程度 。 通 过 基于 密度 的 局 部 离 
群 点 (DLOF) 工法 识别 出 新 颖 专利 ， 利 用 技术 范围 指标 与 同类 专利 数量 指标 构建 研发 组 合 标识 图 。[ 结 
果 / 结论 ] 研究 结果 表明 ， 基 于 专利 的 新 颖 性 研发 组 合 标识 图 可 以 准确 地 识别 出 新 颖 专利 ， 为 技术 研发 提 


供 借鉴 。 
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随 着 新 拉 术 的 不 断 发 展 ， 企 业 逐 渐 意 识 到 
技术 创新 本 里 固 有 的 风险 。 在 这 样 的 背景 下 ， 
技术 机 会 分 析 的 战略 重要 性 得 到 进一步 提升 。 
越 来 越 多 的 企业 开始 通过 组 织 专 家 小 组 ， 掌 握 
产业 的 技术 发 展现 状 ， 力 求 找到 技术 突破 口 。 
随 着 技术 的 不 断 增 值 ， 劳 动 密集 型 产业 被 技术 
创新 型 产业 逐步 取代 ， 耗 费 人 力 及 时 间 的 专家 
讨论 已 经 不 能 满足 创新 周期 逐步 缩短 的 产业 布 


局 0。 因 此 ， 企 业 领 导 者 希望 通过 技术 机 会 分 
析 发 现 潜在 的 技术 机 会 ， 节 约 生产 成 本 及 时 间 
创造 更 多 价值 。 基 于 文献 计量 分 析 与 文本 挖掘 
的 专利 分 析 可 以 用 来 分 析 技术 机 会 点， 客观 的 
识别 出 企业 的 技术 发 展 点 。 

基于 专利 的 技术 机 会 分 析 具 体 是 指 利用 一 
系列 技术 以 及 大 规模 数据 集 对 专利 信息 进行 挖 
据 ， 发 现 新 技术 及 预测 其 市 场 前 景 ， 偏 重 于 技 
术 预 测 和 预见 。 由 于 专利 信息 包含 技术 领域 的 
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关键 性 技术 ， 对 专利 信息 进行 分 析 可 以 为 技术 
机 会 提供 支持 。 技 术 机 会 分 析 的 结果 可 以 利用 
图 形 、 表 格 、 曲 线 图 等 形式 的 专利 地 图 表示 ， 
使 结果 更 加 简洁 、 直 观 趾 。 目 前 已 有 诸多 研究 
将 文本 挖掘 与 数据 降 维 等 数据 挖掘 方法 相 结合 ， 
对 专利 进行 技术 机 会 分 析 。 同 时 ， 专 利空 白地 
图 外、 专利 空缺 地 图 是 、 基 于 生成 式 拓扑 映射 的 
专利 地 图 及 语义 专利 地 图 等 方法 都 被 用 来 进 
行 技术 机 会 的 识别 。 虽 然 许多 学 者 都 从 不 同 角 
度 对 技术 机 会 的 识别 进行 研究 , 但 仍 不 够 精确 。 
现 阶段 的 研究 多 是 将 高 维 的 专利 数据 根据 其 技 
术 之 间 的 相似 性 实现 数据 降 维 ， 使 其 显示 在 一 
个 二 维 专利 地 图 中 。 专 利 地 图 中 的 空白 点 被 解 
释 为 潜在 技术 机 会 ， 空 白 点 的 密度 越 低 ， 则 洪 
在 的 技术 机 会 就 越 大 。 这 样 的 研究 虽然 可 以 节 
省 人 工 操作 的 时 间 ， 但 在 实践 中 分 析 大 量 的 非 
结构 化 数据 时 依然 存在 弊端 。 目 前 关于 专利 地 
图 的 研究 侧重 于 可 视 化 的 方法 中 ， 其 中 最 主要 
的 是 主 成 分 分 析 PCA) 与 自 组 织 映 射 (SOM) 
方法 。 主 成 分 分 析 法 包 是 通过 线性 旋转 变换 寻 
找 方差 最 大 的 方向 作为 坐标 轴 方 向 ， 售 弃 方 差 
较 小 的 维度 实现 降 维 ， 但 是 舍弃 的 变量 中 所 包 
含 的 有 价值 的 信息 并 没有 被 考虑 在 内 。 自 组 织 
映射 外 方法 可 以 实现 向 量 的 非 线 性 映射 和 聚 类 ， 
在 二 维 平面 上 进行 专利 数据 的 预测 ， 具 有 良好 
的 效果 。 但 其 认为 相 邻 输入 向 量 彼 此 无 关 ， 未 
考虑 到 专利 信息 是 一 个 时 间 序 列 ， 相 邻 时 刻 的 
数据 之 间 具 有 较 大 的 相关 性 ， 因 此 采用 自 组 织 
映射 方法 处 理 专 利 问题 会 丢失 很 多 信息 。 关 于 
技术 机 会 分 析 ， 最 新 的 研究 应 用 生成 式 拓 扑 映 
射 中 识别 专利 空白 点 ， 利 用 逆 映 射 保持 原 拓扑 
关系 不 变 生 成 专利 地 图 识别 出 一 种 由 关键 词组 
成 的 关键 词 串 ， 这 组 关键 词 串 是 否 有 意义 以 及 
判断 专利 空白 的 阔 值 都 是 依赖 专家 小 组 的 意见 ， 
使 结果 过 于 主观 凹 。 由 于 专利 空白 评估 存在 一 
定 程 度 的 主观 性 ， 因 此 对 潜在 技术 机 会 的 评价 
也 存在 一 定 的 主观 性 ， 目 前 尚 缺 乏 衡 量 专利 新 
颖 程度 的 客观 指标 。 

鉴于 以 上 存在 的 弊端 ， 利 用 一 种 改进 的 方 
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法 识别 和 评价 技术 机 会 是 必要 的 。 本 文 基于 系 
统 流 程 与 定量 的 方法 识别 出 新 型 专利 ， 取 代 之 
前 的 一 组 代表 专利 的 关键 词 的 专利 空 蝗 ， 使 潜 
在 技术 机 会 的 识别 更 加 精确 。 所 提出 的 方法 的 
核心 是 文本 挖 据 与 局 部 异常 因子 ， 利 用 文本 挖 
掘 的 方法 提取 专利 关键 词 之 后 采用 局 部 异常 因 
子 衡量 一 个 数据 集合 的 新 颖 程度 。 与 现 阶段 的 
以 知识 流动 "与 知识 链接 中 为 基础 进行 技术 
预测 的 方法 不 同 ， 是 以 关键 词 使 用 的 相似 程度 
即 专利 信息 的 新 颖 程度 为 衡量 指标 。 区 别 于 现 
有 研究 ,应 用 技术 范围 指标 取代 被 引 频 次 指标 ， 
与 同类 专利 数量 指标 构建 二 维 研发 组 合 标识 图 ， 
使 专利 标识 图 简洁 精确 的 同时 更 加 适用 于 分 析 
中 文 文本 的 专利 信息 。 


O 新颖 专利 研发 组 合 标 识 图 的 构建 


2. 构建 专利 和 矩阵 

传统 的 专利 矩阵 ， 将 一 个 系统 分 解 为 几 个 
相互 排斥 且 完 全 穷尽 的 二 维 矩阵 。 这 种 方法 允 
许 系统 对 各 维度 进行 单独 处 理 ， 汇 总 后 形成 对 
整个 数据 的 分 析 。 本 文 对 专利 的 文本 信息 进行 
挖掘 ， 将 专利 的 签发 日 期 、 专利 号 以 及 专利 关 
键 词 所 构建 的 以 关键 词 CSi o. Sand) 为 横 轴 、 
专利 号 (P,，.…，P,) 为 纵 轴 的 专利 矩阵 作为 局 
部 离 群 点 检测 的 输入 值 。 表 1 中 列举 的 专利 矩 
阵 中 ， 签 发 日 期 与 专利 号 用 文本 形式 表示 ， 而 
关键 词 向 量 则 用 二 进 制 值 表示 , “1 代表 该 专利 
与 列 出 的 关键 词 相 关 ， 而 “0” 则 意味 着 不 相关 。 
表 一 中 ，P; EE YMD; X, TED, 的 维度 具 
有 Si 关键 词 ，D, 有 S, 关键 词 。 具 体形 态 如 表 
1 所 示 : 
22 识别 新 颖 专利 

基于 密度 的 局 部 异常 挖掘 算法 不 再 把 异常 
看 做 是 一 种 二 元 属性 ( 只 有 异常 与 非 异 常 的 区 别 
)， 而 是 用 局 部 异常 因子 LOF 来 表示 对 象 的 异常 
程度 。 对 象 p 的 局 部 异常 因子 反映 了 该 对 象 的 
异常 程度 ， 局 部 异常 因子 LOF) 越 大 ， 则 该 对 
象 是 异常 数据 的 可 能 性 越 大 ， 反 之 ， 则 该 对 象 
是 异常 数据 的 可 能 性 越 小 。 
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表 1 专利 矩阵 示例 


专利 号 公布 日 期 2 = 二 p 

Si Si Em te S5 Su Sun 
P, YMD, 1 . 0 0 . 0 0 . 0 
P, YMD, 1. 0 1 . 0 0 . 0 
P, YMD, l.l 0 0. 0 0 . 0 
P, YMD, 0 . 0 1 . 1 1 . 0 
P, YMD, 0 . 1 1 . 0 0 . 0 
P, YMD, 0 . 0 0. 0 0 . 1 
P; YMD; 0 . 0 0. 0 0 . 1 
P, YMD, 0 . 0 1 1 Tros 1 


本 文 所 提出 的 方法 利用 基于 密度 的 局 部 异 
AFP LOF) 评 佑 专利 的 异常 程度 ， 以 实现 
定量 结果 的 客观 解释 。 该 方法 可 以 在 过 滤 异 常 
值 的 基础 上 检测 任意 形状 的 自然 聚 类 。 某 一 点 
的 局 部 异常 值 通过 该 点 与 周围 各 点 的 平均 密度 
比值 得 到 。 具 体 计算 分 为 4 个 步 又: 中 对 象 p 
的 k- 距离 (k-distance(p) JJ p 与 其 近邻 k 的 欧 
儿 里 得 距离 ， 其 中 k 值 被 定义 为 参数 聚 类 的 最 
小 距离 ，@@ 将 q EXN p 的 可 达 距 离 ， 表 示 为 
reachDistk(p,q)， 通 过 max{d(p,q), k-distance(p)} 
得 到 ，d(p,q) Bl p 与 gq 之 间 的 欧 几 里 得 距离 ; 
@ Ni(p) 定义 为 p 的 K 近 邻 点 的 集合 ， 以 密度 
为 基础 的 可 达 距 离 表 示 为 Idx(p)， 如 公式 (1) 
所 示 ; Wp 对 其 周转 对象 k 的 LOF 值 如 公式 (2) 
所 示 。 


k 
Hag e—————MÀ—— 
rdi(p) Y. reachDisti( p,q) 
qeNk(p) ( 1 ) 
LOF(p)- - ue 
k geNE(p) Irdk(p) (2) 


评估 专利 新 颖 程度 的 过 程 主要 分 为 两 步 : 

(1) LOF 的 计算 。 假 设 PSi 被 定义 为 一 组 
j 年 发 布 的 专利 ， 其 中 每 个 专利 在 形态 学 矩阵 
中 都 由 关键 词 向 量 表示 (Sus Si Ls Su e 
对 于 专利 P， 我 们 将 计算 出 的 LOFi (Pi) 定义 
为 专利 P; 的 局 部 异常 值 。 在 本 文 所 提出 的 方法 
H, k 值 被 定义 为 专利 的 数量 ， 如 大 多 数 形态 
结构 专利 数据 一 样 ， 将 k 值 定 义 为 专利 数量 。 


通过 确定 合适 的 k 值 ， 可 以 计算 出 所 有 专利 的 
LOF 值 。 

(2) LOF 的 标准 化 。 通 过 LOF 值 我 们 可 
以 分 析出 某 年 度 专 利 的 新 颖 程度 。 但 由 于 某 一 
专利 的 LOF 值 在 不 同年 份 存在 差异 ， 随 着 时 间 
推移 ，LOF 值 的 变化 较 难 掌握 。 即 使 某 专利 在 
不 同 的 两 年 中 LOF 的 值 相同 ， 其 新 专利 也 会 因 
不 同 专利 集合 而 有 所 差异 。 为 解决 这 一 问题 ， 我 
们 引入 核 密 度 估计 的 方法 使 LOF 的 值 标准 化 。 
核 密度 估计 是 从 离散 样本 中 确定 概率 分 布 也 数 
的 非 参 数 佑 计 方 法 。J 年 发 表 专 利 的 概率 分 布 函 
数 定义 为 fLOF)， 通 过 核 密度 估计 计算 ， 如 公 
X (3) Bn: 


1 n(py) p, LOF -LOF(CPD 
(LOF) = KE 
EID PS 2a h l 
(3) 

对 于 LOF) ?Ái-L...,n BE S ER R, 


n(PSi) 是 专利 的 数量 ，K 为 高 斯 核 函数 ，h 为 平 
滑 因 子 ， 计 算出 的 Ri(P) 为 每 个 LOF(P;) 的 相对 
新 颖 率 ， 如 公式 4) Bron: 


LOF(Pi) 
Ji(LOF)aLOF 


(4) 
相对 新 颖 率 RP) 5 j 年 公布 的 专利 P; 相 比 
LOF 值 较 低 ， 因 此 我 们 可 以 将 P; 作 为 R; CP) 
新 专利 的 扩大 值 。 其 允许 对 某 一 年 专利 的 LOF 
值 进行 比较 以 及 对 特定 的 专利 新 颖 性 进行 动态 
分 析 。 


RA(P)=F(LOF(p)=| 


一 00 
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2.3 构建 新 颖 专利 研发 组 合 标识 图 

在 识别 出 新 颖 专利 的 基础 上 ， 本 文 利用 专 
利 技术 范围 与 同类 专利 数量 这 两 个 指标 ， 综 合 
分 析 并 识别 专利 技术 机 会 。 现 阶段 的 研究 应 用 
专利 被 引 频 次 评估 技术 机 会 ， 认 为 专利 的 被 引 
频次 越 高 ， 该 专利 拥有 的 技术 与 经 济 影响 力 就 
越 大 ， 但 专利 的 审批 与 专利 发 布 之 间 存 在 时 间 
差 。 越 来 越 多 的 研究 指出 ， 较 早 公开 的 专利 与 
新 专利 的 被 引 频 次 在 一 定 程 度 上 受到 时 间 的 制 
约 ， 因 此 本 文 应 用 技术 范围 这 一 指标 替换 专利 
被 引 频次 这 一 维度 。 专 利 技术 范围 是 指 某 一 专 
利 的 分 类 号 的 数量 及 范围 ， 每 个 专利 除去 其 拥 
有 的 主 分 类 号 ， 其 分 类 号 数量 越 多 说 明 该 技术 
履 盖 的 范围 越 广 ， 影 响 力也 越 大 。 而 随 着 知识 
产权 保护 的 发 展 ， 专 利 侵权 出 现 的 频率 逐年 上 
升 ， 所 带 来 的 经 济 赔偿 也 逐年 提高 。 受 收益 率 
与 专利 价值 的 制约 ， 同 类 专利 的 数量 一 定 程度 
上 可 以 说 明 专 利 的 可 效仿 程度 ， 同 类 专利 数量 
越 少 ,该 专利 可 效仿 程度 越 高 。 基 于 这 些 因素 ， 
新 疾 专 利 研发 组 合 标识 图 的 构建 以 技术 范围 与 
同族 专利 的 数量 为 评价 指标 。 


全 实证 研究 一 一 以 溶 栓 药 领 域 为 例 
近年 来 ， 随 着 人 口 老龄 化 的 加 剧 ， 外 周 血 


ChinaXiv 合 作 期 刊 
知识 管理 论坛 , 2016( 4 ):276-282 
DOI; 10.13266/j.issn.2095—-5472.2016.033 


管 疾病 的 发 病 率 呈 逐年 上 升 趋势 。 在 美国 ，60 
岁 以 上 的 人 和 群 中 有 多 达 5% 的 男性 和 2.5% 的 女 
性 患者 存在 间 欣 性 跨行 症状 。 溶 栓 药 、 抗 血小板 
药 是 降低 心 脑 血 管 病 发 生 几 率 的 有 效 药物 中 。 
医药 相关 企业 着 力 于 研制 新 型 、 高 效 溶 栓 药物 ， 
因此 ， 在 该 领域 识别 出 新 的 技术 机 会 是 必要 的 。 
3.1 数据 来 源 与 方法 

本 人 研究 的 数据 来 源 于 中 国 知 网 (CNKID) 
的 中 国 专利 数据 库 ， 检 索 截 止 到 2015 年 11 月 
15 日 溶 栓 药 领 域 的 全 部 发 明 专 利和 实用 新 型 
专利 。 共 获得 561 个 相关 专利 族 ， 去 重 后 利用 
Microsoft Office Access 建立 包含 标题 、 申 请 人 、 
地 址 、 公 布 日 期 、 公 开 号 等 条 目的 专利 数据 库 ， 
并 基于 专利 号 、 公 布 日 期 与 摘要 构建 专利 矩阵 。 
3.2 构建 专利 矩阵 

利用 文本 挖掘 软件 TextAnalysis 2.1 基于 
TF-IDF 指数 发 现 描 述 溶 栓 药物 特征 的 8 个 维度 
的 25 个 重要 关键 词 ， 再 进一步 通过 Salton 索 尔 
顿 海 指数 找到 关键 词 的 共 现 关 系 ， 使 关键 词 的 
确定 更 加 精确 高 效 。 

溶 栓 药 领域 的 8 个 维度 分 别 为 : 制备 方法 、 
医疗 器 械 、 作 用 部 位 、 中 药 组 合 物 、 医 药 组 合 物 、 
治疗 方法 、 基 因 表 达 与 生物 制药 。 具 体 和 矩阵 见 
X2. X3. 


表 2 溶 栓 药物 的 专利 矩阵 结构 
维度 有 具体 描述 关键 词 

制备 方法 (D1) 提取 (S11) 42, 5t... 

纤 溶 酶 (S12) RE, WAR... 

重组 (S13) 蛋白 、DNA 序列 … 
医疗 器 械 〈D2) 导管 (S21) 逆向 溶 栓 、 药 物 注射 .… 

超声 (S22) 破 菌 处 理 、 空 化 效应 .… 
作用 部 位 (D3) 腔 静 脉 (831) 闭塞 、 抗 凝 … 

深 静 脉 (S32) 融合 蛋白 、 脂 质 体 … 
中 药 组合 物 (D4) 成 分 组 合 (S41) HE S.S AES... 
生物 制药 D5) 融合 蛋白 〈S51) 凝 胶 层 析 、 亲 和 层 析 .… 

蛋白 质 药物 (S52) 人 组 织 型 、 大 肠 杆菌 .… 


治疗 方法 (D6) 


ELISA(S63) 
载体 (S71) 
溶 栓 酶 (S72) 


因 表 达 (D7) 


Ion 


DRI KERA... 
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表 3 部 分 溶 栓 药物 的 专利 矩阵 
制备 方法 基因 表达 
专利 号 公开 日 其 mE 
提取 纤 溶 酶 配方 se 载体 溶 栓 酶 
CN1037275 19891122 0 0 1 - 0 0 
CNI1037345 19891122 0 1 0 -— 0 0 
CN1053007 19910717 0 0 1 - 0 0 
CNI105012381A 20151104 0 0 1 0 0 
CN105039377A 20151111 0 0 0 1 1 
CN105072914A 20151118 0 0 0 0 0 
3.3 识别 新 颖 专利 Ae B 
通过 专家 讨论 确定 主要 专利 的 数量 后 , K 值 056 = Lis] (5) 


的 确定 分 为 两 个 步骤 ， 首 先 通过 计算 确定 多 数 
专利 的 数量 ， 然 后 测量 专利 和 矩阵 中 关键 字 向 量 
之 间 的 余弦 相似 性 ， 帮 助 专家 判断 具体 的 K 值 。 
余弦 相似 度 被 认为 是 计算 两 个 非 结构 化 文档 之 
间 相 似 度 的 最 常用 指标 ， 计 算 方 法 如 公示 C5) 
所 示 : 


A 5 B 即 代表 文档 中 的 关键 词 向 量 。 相 似 
性 的 范围 定义 为 0 至 1， 两 个 文件 相似 性 越 高 ， 
则 值 也 越 大 。 通 过 计算 最 终 确 定 k 的 值 为 10， 
通过 Metlab 计算 LOF 值 及 标准 化 的 LOF 值 ， 
得 出 每 个 专利 的 新 颖 程度 评估 数值 ， 部 分 专利 
相对 新 颖 程度 如 表 4 所 示 : 


表 4 部 分 溶 栓 药物 的 专利 新 颖 程度 


: 专利 新 颖 程度 
专利 号 公开 日 期 

2010 2011 2012 2013 2014 2015 

CN1037275 19891122 0.0451 0.0333 0.0046 0.0021 0.0046 0.0083 
CN1037345 19891122 0.0394 0.0474 0.0342 0.0659 0.0097 0.0057 
CN1053007 19910717 0.0392 0.0213 0.0237 0.0096 0.0073 0.0049 
CN105012381A 20151104 = = = 三 = 0.3836 
CN105039377A 20151111 一 一 — E 一 0.2453 
CN105072914A 20151118 = ES - = - 0.5352 


3.4 新 颖 专利 研发 组 合 标识 

排名 前 5% 的 专利 研发 组 合 标 识 图 如 图 1 
所 示 ， 根 据 专利 矩阵 的 信息 将 专利 用 圆圈 表 
示 ， 圆 圈 的 大 小 表示 专利 的 重要 程度 。 横 轴 与 
纵 轴 的 分 类 线 分 别 为 专利 技术 范围 与 同类 专利 
数量 经 过 标准 化 计算 后 的 平均 值 。 专 利 应 用 数 
量 的 高 低 也 决定 了 专利 影响 力 的 大 小 ， 而 专利 


80 


的 价值 及 潜在 价值 需要 通过 调查 确定 。 通 过 本 
文 所 构建 的 方法 识别 出 专利 CN102311396A 与 
CN102210666A 为 溶 栓 药 领 域 的 技术 机 会 。 吡 
嗪 类 衍生 物 的 抗 氧化 作用 和 溶 栓 作 用 ， 制 备 治 
疗 由 于 自由 基 过 量 产生 或 血栓 引起 的 心 、 脑 
血管 系统 疾病 以 及 退行 性 老化 疾病 等 的 新 型 
药物 。 丹 酚 酸 A 可 用 于 制备 促进 血 或 血浆 中 
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CAMP 含量 升 高 的 药物 , n c 3 nd vL 7] HP 
酸 二 酯 酶 活性 的 药物 ， 特 别 是 可 用 于 制备 预防 
或 治疗 溶 栓 、 经 皮 冠 状 动脉 介入 术 或 冠 脉 搭桥 
术 等 原因 引起 的 心肌 缺 血 再 灌注 损伤 的 药物 。 
相关 研发 企业 可 就 以 上 两 个 专利 相关 技术 进行 
重点 研发 。 

本 文 所 构建 的 新 颖 专利 研发 组 合 标识 图 是 


5000 
g 
4500 |; 
响 
w D 
3500 : 
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对 特定 时 间 内 某 一 横 截 面 的 评价 ， 识 别 出 的 结 
果 会 随 着 技术 的 发 展 不 断 变化 ， 如 果 特 定 的 技 
术 潜 在 机 会 进入 一 个 新 的 阶段 则 其 在 标识 图 中 
的 信息 需要 被 移 除 。 虽 然 专利 研发 组 合 标识 图 
的 结构 是 不 固定 的 ， 但 初始 的 专利 矩阵 建立 后 
是 可 以 重复 使 用 的 ， 我 们 只 需要 将 新 生产 出 的 
专利 信息 加 入 到 和 矩阵 中 即 可 。 


高 影响 力 & 不 可 效仿 


CN1016233321 
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专利 技术 范围 


1 新 颖 专利 研发 组 合 标识 图 


Qt 


本 人 研究 基于 系统 流程 与 科学 方法 提出 了 一 
种 利用 识别 新 新 专利 进行 技术 机 会 识别 的 方法 : 
通过 确定 异常 专利 ， 而 不 是 由 一 组 关键 词组 成 
的 专利 关键 词 新 组 合 ， 使 技术 机 会 的 识别 更 加 精 
确 。 男 外 ， 专 利 新 颖 程度 可 以 通过 量化 指标 进行 
比较 ， 使 结果 更 加 客观 。 技 术 机 会 分 析 战 略 被 认 
为 是 新 兴 技 术 生 成 竞争 情报 的 有 效 手 段 "…。 本 文 
基于 定量 数据 与 系统 流程 提出 了 一 种 技术 机 会 
识别 的 方法 ， 将 基于 密度 的 局 部 离 群 点 CLOF) 
的 应 用 领域 从 过 程控 制 、 故 障 检 测 扩展 为 通过 
文本 挖掘 技术 对 新 型 专利 信息 进行 整合 和 解释 。 
与 当前 的 研究 不 同 ， 应 用 技术 范围 取代 被 引 频 


次 这 一 指标 ， 与 同类 专利 数量 构建 二 维 研发 组 
合 标 识 图 ， 使 专利 标识 图 更 加 简洁 精确 。 本 文 
所 提出 的 方法 的 局 限 性 在 于 ， 所 生成 标识 图 中 
出 现 的 并 不 是 一 套 明确 的 新 专利 ， 而 是 将 可 能 
性 极 高 的 新 专利 识别 出 来 ， 且 在 一 定 程度 上 仍 
然 要 依靠 专家 评价 确定 。 今 后 的 改进 方向 为 逐 
步 提 高 量化 指标 衡量 的 程度 ， 减 少 主观 评价 从 
而 进一步 优化 技术 机 会 识别 流程 。 
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Technology Opportunity Analysis Based on the Combination of Patent Novelty 
Research and Development—A Case Study of Thrombolytic Drugs 


Tao Chenglin Wang Wei Zhang Shiyu 
Department of medical informatics, School of Public Health, Jilin University, Changchun 130021 

Abstract: [Purpose/significance] The meanings of potential technology opportunities become more explicit 
by identifying anomaly patents rather than patent vacancies that are usually represented as a simple set of 
keywords. [Methods/Process] We propose an approach to detecting anomaly patents based on systematic 
processes and quantitative outcomes. Density-based Local Outlier (DLOF) algorithm is used to identify 
novelty patents, then use scope of technology index with amount of similar patents index structure Anomaly- 
portfolio patent map. [Results/Conclusion] Research results show that novelty-focused patent mapping for 
technology opportunity analysis can accurately identify the novelty patents and provide a reference for the 
technology research and development. 

Keywords: technology opportunity analysis — novelty-focused — novelty-focused patent identification map 
text mining local outlier factor 
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